速度更快、精度更高的机器学习,助力计算化学新发现
对于分子和材料中电子的薛定谔方程的精确解,将极大地提高我们发现化学物质的能力,但计算的成本使这成为不可能。自从狄拉克第一次劝我们找到合适的近似来绕过这一成本以来,人类已经取得了很大的进展,但在可预见的未来仍有很多事情是无法实现的。机器学习(ML)的核心希望是,通过对少数几种情况的特性进行统计学习,我们可能会跳过这一过程中最严重的瓶颈。
在过去的十年里,我们目睹了越来越多的机器学习应用于化学科学的各个方面。在这里,我们通过按时间顺序考虑选定的电子结构、原子间势和化合物空间的研究,突出了机器学习模型在计算化学领域的具体成就。
今天,我们就一起来回顾一下机器学习在计算化学中的最新进展。
用机器学习设计和理解光收集装置
了解光收集的基本过程对开发清洁能源材料和设备至关重要。生物有机体已经进化出复杂的代谢机制来有效地将阳光转化为化学能。了解光收集的基本过程对开发清洁能源材料和设备至关重要。生物有机体已经进化出复杂的代谢机制来有效地将阳光转化为化学能。在此,来自加拿大多伦多大学的Alán Aspuru-Guzik等研究者,对用机器学习来设计和理解光收集装置,进行了前瞻性地评述。揭开这种转化的秘密,激发了清洁能源技术的设计灵感,包括太阳能电池和光催化水分解。从微观过程中描述宏观特性的出现,跨越了几个数量级的长度和时间尺度。机器学习经验越来越受欢迎,作为一种工具,它弥合了多层次理论模型和爱迪生式的试错方法之间的差距。机器学习提供了一个机会,可以对控制光收集现象的基本原理获得详细的科学见解,并可以加速光收集设备的制造。
参考文献:Häse, F., Roch, L.M., Friederich, P. et al. Designing and understanding light-harvesting devices with machine learning. Nat Commun 11, 4587 (2020). https://doi.org/10.1038/s41467-020-17995-8
原文链接:
https://www.nature.com/articles/s41467-020-17995-8#citeas
机器学习如何帮助选择覆盖层来抑制钙钛矿降解
钙钛矿太阳能电池(PSCs)的环境稳定性,可通过对沉积在钙钛矿吸收层(称为覆盖层)顶部的薄低维(LD)钙钛矿进行反复试验来提高。在此,来自美国麻省理工学院的Tonio Buonassisi & Shijing Sun等人,提出了一个机器学习框架来优化这一层。研究者选取了21种有机卤化物盐,将它们作为覆盖层应用于甲基铵碘化铅(MAPbI3)薄膜上,在加速条件下对其进行老化,并使用监督机器学习和Shapley值确定控制稳定性的特征。研究发现,有机分子的氢键供体数量少,拓扑极性表面积小,这与MAPbI3膜的稳定性增加有关。性能最好的有机卤化物,苯三乙基碘化铵(PTEAI),成功地延长了MAPbI3的稳定寿命4±2倍的光面MAPbI3和1.3±0.3倍的最先进的辛基溴化铵(OABr)。通过表征,研究者发现这个覆盖层通过改变表面化学和抑制甲基铵的损失来稳定光活性层。
参考文献:Hartono, N.T.P., Thapa, J., Tiihonen, A. et al. How machine learning can help select capping layers to suppress perovskite degradation. Nat Commun 11, 4172 (2020). https://doi.org/10.1038/s41467-020-17945-4
原文链接:
https://www.nature.com/articles/s41467-020-17945-4#citeas
从符号回归中派生的简单描述符加速了新型钙钛矿催化剂的发现
符号回归(SR)是一种可解释的机器学习方法,可用于构建最适合特定数据集的数学公式。在此,来自美国托莱多大学的Yanfa Yan & 苏州大学的Wan-Jian Yin等人,用SR来指导新型氧化钙钛矿催化剂的设计,提高了析氧反应(OER)的活性。一个简单的描述符,μ/t,其中μ和t分别被确定是八面体和耐受性因子,这加速了一系列新的氧化钙钛矿催化剂的发现,提高了OER活性。研究者成功地合成了五种新的氧化物钙钛矿,并表征了它们的OER活性。其中,Cs0.4La0.6Mn0.25Co0.75O3、Cs0.3La0.7NiO3、SrNi0.75Co0.25O3、Sr0.25Ba0.75NiO3是活性最高的氧化物钙钛矿催化剂。该研究结果证明了SR在加速数据驱动设计和发现具有改进性能的新材料方面的潜力。
参考文献:Weng, B., Song, Z., Zhu, R. et al. Simple descriptor derived from symbolic regression accelerating the discovery of new perovskite catalysts. Nat Commun 11, 3513 (2020). https://doi.org/10.1038/s41467-020-17263-9
原文链接:
https://www.nature.com/articles/s41467-020-17263-9#citeas
利用机器学习揭示界面诱导的液体有序对晶体生长的影响
结晶过程通常是根据形成的晶体的基本微观结构元素来理解的,如表面取向或存在缺陷。然而对于液体结构在晶体生长动力学中的作用,人们所知甚少。在此,来自美国史丹佛大学的Rodrigo Freitas等人,利用原子模拟和机器学习方法一起,证明了固-液界面附近的液体呈现显著的结构有序,这有效地降低了原子的迁移率,减缓了结晶动力学。通过对硅和铜的详细研究,研究者发现,界面诱导有序(IIO)对液体流动性的影响程度,随相邻界面的有序程度和性质有很大的不同。本文解释了IIO各向异性背后的物理机制,并证明了在物理驱动的晶体生长模型中引入这种效应,能够定量预测生长速率与温度的相关性。
参考文献:Freitas, R., Reed, E.J. Uncovering the effects of interface-induced ordering of liquid on crystal growth using machine learning. Nat Commun 11, 3260 (2020). https://doi.org/10.1038/s41467-020-16892-4
原文链接:
https://www.nature.com/articles/s41467-020-16892-4#citeas
红外光谱数据和物理驱动的机器学习表征复杂材料表面微观结构
为了加速材料的设计,需要表征复杂材料及其在反应条件下的动力学特性。吸附质振动激发对吸附质/表面相互作用具有选择性,与激活吸附质振动模式相关的红外(IR)光谱是准确的,可以捕获大多数模式的细节,并可以得到操作。目前的解释依赖于简单谱的启发式峰分配,排除了获得详细结构信息的可能性。在此,来自美国特拉华大学的Dionisios G. Vlachos等人,将基于数据的方法与依赖化学的问题公式相结合,以开发物理驱动的替代模型,通过第一性原理计算生成合成红外光谱。利用一氧化碳在铂上的合成红外光谱,研究者通过神经网络集成,实现了多项回归来学习描述吸附位点和量化不确定性的概率分布函数(pdfs)。研究者使用这些pdfs从实验光谱中推断出详细的表面微结构,并将该方法扩展到其他系统,作为表征复杂界面和闭合材料间隙的第一步。
参考文献:Lansford, J.L., Vlachos, D.G. Infrared spectroscopy data- and physics-driven machine learning for characterizing surface microstructure of complex materials. Nat Commun 11, 1513 (2020). https://doi.org/10.1038/s41467-020-15340-7
原文链接:
https://www.nature.com/articles/s41467-020-15340-7#citeas
唯理计算小福利:
针对模拟计算我们有专门的沟通群,想进群的小伙伴加微信
17812574221
备注:模拟计算进群
群里可以和老师一起探讨问题,老师也会帮助解答问题的哦~
推荐阅读:
【福利】租超算送课程,就在唯理计算,还有2400核时免费试用
【经典收藏】2005年NCHC的VASP workshop,好资源不过时
END